中国城市NDVI十年度统计数据集(250-m1990–2020)的研发

刘海猛1,周天宇2*,勾  2

1. 中国科学院地理科学与资源研究所,北京 100101
2.
南湖实验室大数据技术研究中心,嘉兴 314002

  植被覆盖是衡量生态环境质量和人居环境的重要指标,然而目前还缺乏城市内部长时间序列的NDVI数据集。作者基于Terre-MODIS NDVIGIMMS NDVI产品数据,运用深度学习超分辨率的算法制作了1990200020102020年中国250-m分辨率NDVI数据集。然后,通过叠加不同时期城市的行政范围和实体地域范围,提取不同城市范围内的NDVI平均值,得到中国十年度及361个城市平均NDVI值统计数据集(250-m1990–2020)。该数据集显示1990–2020年中国全境和城市范围的NDVI均呈先降低后升高的趋势,但存在显著的空间异质性。该数据集可为城市生态环境治理、城市绿地规划建设、生态环境政策制定和政府绩效考核等提供基础数据支撑,也可作为城市化与气候变化驱动下生态系统演化研究的基础数据。数据集存储为.tif.xlsx格式,空间分辨率为250 m,由5个文件组成,数据量为6.51 GB(压缩为5个文件,1.83 GB)。

关键词植被覆盖;城市化;NDVI;城市实体地域;深度学习;中国

DOI: https://doi.org/10.3974/geodp.2023.01.09

CSTR: https://cstr.escience.org.cn/CSTR:20146.14.2023.01.09

数据可用性声明:

本文关联实体数据集已在《全球变化数据仓储电子杂志(中英文)》出版,可获取:

https://doi.org/10.3974/geodb.2023.04.06.V1https://cstr.escience.org.cn/CSTR:20146.11.2023.04.06.V1.

 

1  前言

植被是生态系统的重要组成部分,植被覆盖是衡量生态环境质量和人居环境的重要指标,在全球环境变化研究中担任着“指示器”的角色[1]。中国快速城市化进程极大地影响了植被覆盖[2],而植被覆盖降低反过来也作用于城市环境[3],加剧城市热岛效应[4]、不利于空气污染物扩散[5]、削弱区域碳汇能力[6],并对城市居民的健康福祉产生负面影响[7]。让所有市民享有足够的平等的城市绿地是联合国2030年可持续发展目标11的重要内容[8]

归一化植被指数Normalized differential vegetation index, NDVI)是反映植被覆盖变化的主要指标之一。其中GIMMS NDVIMODIS NDVI产品数据是最常用的NDVI数据集,并已在区域和全球范围内广泛应用[9, 10]MODIS数据被视为GIMMS数据的延续[11],但两者之间存在空间分辨率差距较大、时间覆盖不同等问题,限制了我们对城市化过程中NDVI变化的正确评估和理解。已有的数据集多为栅格数据或城市行政范围内的数据,且时间序列多为2000年之后[12, 13],缺乏以建设用地为主的城市实体地域范围内的长时间序列的高分辨率NDVI数据集。

本文分别收集了多个年份Terre-MODIS NDVIGIMMS NDVI产品数据,以250-m空间分辨率的MODIS数据为基准,通过深度学习超分辨率的算法对GIMMS数据集进行空间降尺度,以此延长高分辨率下NDVI的时空覆盖率,得到1990200020102020年中国250-m分辨率NDVI数据集。然后,选择全球城市边界(Global urban boundary, GUB)数据集来厘定不同时期城市的实体地域范围,并提取城市实体地域范围内的NDVI数值,分别计算1990200020102020年共4期中国361个城市行政范围和实体地域范围内NDVI平均值。该数据集可为城市生态环境治理、城市绿地规划建设、生态环境政策制定和政府绩效考核等提供基础数据支撑,也可作为城市化与生态环境领域研究的基础数据。

2  数据集元数据简介

《中国十年度及361个城市平均NDVI值统计数据集(250-m1990–2020)》[14]的名称、作者、地理区域、数据年代、时间分辨率、空间分辨率、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1

3  数据研发方法

3.1  数据来源

本研究选用的GIMMS NDVI数据集来自美国国家环境信息中心提供的第3NDVI产品数据,空间分辨率为1/12度(约8 km),时间跨度为19891991年和20002013年。Terre-MODIS NDVI产品数据来源于NASA MODIS陆地产品组根据统一算法开发的MODIS植被指数产品,本研究选用的是250-m分辨率16天合成的MOD13Q1数据集,以及1-km分辨率16天合成的MOD13A2,时间跨度均为20002020年。除此之外,本文还选取了Landsat 5年际NDVI数据集、Aqua MODIS NDVI数据集和NOAA CDR AVHRR NDVI数据集作为交叉验证数据。本研究中的城市行政区划数据为2019年,来自国家基础地理信息中心,涵盖了中国所有地级行政单元以及部分省份的直辖市县。19902020年城市实体地域范围来源于全球城市边界(Global Urban Boundary, GUB)数据集[16]。该数据集结合了宏观尺度的核密度分析和微观尺度的邻域扩张算法,对于城市外缘地区进行形态学处理,采集了全球所有面积超过1 km2的城市及邻近居民点的边界。该数据集的城市轮廓中不仅包括不透水面,也包括城市内部的绿地、水体等其他相关用地类型,图1是截取的这个数据集中的北京市作为示例展示。

1  《中国十年度及361个城市平均NDVI值统计数据集(250-m1990–2020)》元数据简表

 

 

数据集名称

中国十年度及361个城市平均NDVI值统计数据集(250-m1990–2020

数据集短名

ChinaCitiesNDVI_1990_2020 

作者信息

刘海猛R-7364-2018, 中国科学院地理科学与资源研究所, liuhm@igsnrr.ac.cn

周天宇, 南湖实验室大数据技术研究中心, zhoutianyu@nanhulab.ac.cn

勾鹏, 南湖实验室大数据技术研究中心, goupeng@nanhulab.ac.cn

地理区域

中国

数据年代

1990200020102020

时间分辨率

空间分辨率

250 m

数据格式

.tif.xlsx

数据量

6.51 GB

数据集组成

1990200020102020年中国250-m分辨率NDVI年平均数据;

1990200020102020年中国城市行政范围和实体地域范围NDVI年平均数据

基金项目

国家自然科学基金(42171210);教育部人文社会科学重点研究基地重大项目(22JJD790015

数据计算环境

Google Earth Engine; Python; ArcGIS

出版与共享服务平台

全球变化科学研究数据出版系统 http://www.geodoi.ac.cn

地址

北京市朝阳区大屯路甲11100101,中国科学院地理科学与资源研究所

数据共享政策

全球变化科学研究数据出版系统的“数据”包括元数据(中英文)、通过《全球变化数据仓储电子杂志(中英文)》发表的实体数据集和通过《全球变化数据学报(中英文)》发表的数据论文。其共享政策如下:(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报(中英文)》编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[15]

数据和论文检索系统

DOICSTRCrossrefDCICSCDCNKISciEngineWDS/ISCGEOSS

 

1  北京市城市行政范围和城市实体地域范围示意图

3.2  数据预处理

MODIS NDVI数据被视为GIMMS NDVI数据的延续,已有大量研究表明在一定的转换关系下,两种数据结果具有极强的一致性。本文采用了Fensholt的换算公式(式1[11],将GIMMS NDVI数据值域转换至与MODIS NDVI一致。该公式基于20002010年期间,GIMMS NDVIMODIS NDVI每月观测值的线性回归趋势分析的回归系数所得,并针对中国、加拿大、澳大利亚等国家开展了具有区域特点的模型拟合,其长时间序列的结果具有一定的区域代表性[11]

                                   GIMMS NDVI=1.39×MODIS NDVI–0.09                            (1)

为进一步验证该换算公式在中国全域的适用性,本文选取了位于不同区域的武汉、成都、昆明、杭州、沈阳5个城市,计算2010年度MODIS数据在经过换算后与GIMMS数据的均方根误差(RMSE),以反映该公式在中国中部、西部、南部、东部和东北地区的适用性。结果如表2所示,MODIS NDVI在经过式1换算后,其与GIMMS NDVI的均方根误差平均在0.024RMSE最高的城市武汉也仅为0.034。因此,本文认为该公式在中国范围内具有较好的适用性。

 

2  换算后MODIS NDVIGIMMS NDVI在中国5个城市的均方根误差统计表

城市

武汉

成都

昆明

杭州

沈阳

平均值

RMSE

0.034

0.019

0.033

0.029

0.006

0.024

 

为尽可能弱化单一年份的植被指数可能受气象条件变化、极端气象灾害等因素的影响,本数据集虽然重点选取了四个时间点(1990200020102020年),但每个时间点实际融合了3年的NDVI数据(1989–1991年、20002002年、20092011年和20192021年)。通过谷歌地球引擎平台(Google Earth EngineGEE)对GIMMS NDVI数据和MODIS NDVI数据(250-m)进行子集提取、图像镶嵌、裁剪数据、像元融合、投影转换等预处理步骤,并计算每个时间段内NDVI指数的平均值,以代表相应时期植被生长的平均状态,获得中国GIMMS NDVI数据集(1990年)和MODIS NDVI数据集(2000年、2010年、2020年)。此外,为给后续超分辨率模型提供训练样本,本研究在GEE平台上采用同样的数据预处理步骤,分别制作了20002020年期间GIMMS NDVIMODIS NDVI1 km)和MODIS NDVI250-m)的年际尺度NDVI数据。

3.3  图像超分辨率深度学习算法

本研究基于Lei提出的一种局部-全局结合网络(Local-Global Combined Networks, LGC-Net)的图像超分辨率深度学习算法[17],分别使用1-km250-mMODSI NDVI数据集对GIMMS NDVI数据集进行二阶超分辨率图像重构,实现GIMMS NDVI在不损失原有植被指数特征的情况下,重采样至更高的空间分辨率。第一阶段将20002010年尺度的GIMMS NDVI以同年份1-km MODIS NDVI数据为训练对象,实现8-km1-km超分辨率模型训练,并重构1-km分辨率下的GIMMS NDVI数据;第二阶段将完成重构的1-km GIMMS NDVI图像以250-m MODIS NDVI数据为训练对象,完成1-km250-m超分辨率模型训练,并将生成结果与原始GIMMS NDVI结果进行误差比对,进一步优化超分辨率模型的精度。最后,将已完成数据预处理的1990GIMMS NDVI数据输入这个二阶超分辨率模型,重构250-m分辨率的1990GIMMS NDVI数据。LGC-Net的算法原理如图2所示:(1)利用多层卷积,获取不同层的主要特征表示;(2)在局部-全局信息结合部分,通过将不同层的结果级联起来,实现一种多叉结构;(3)最后在重建部分对图像进行更高分辨率的重构。

 

2  LGC-Net图像超分辨率深度学习算法流程图

 

3.4  技术路线

本数据集的主要研发过程如图3所示。首先,按照前文数据预处理的步骤,分别对20002013年度GIMMS NDVI数据集、20002013年度Terre-MODIS数据集(1-km250-m)进行数据预处理,并将这些数据作为训练集输入LGC-Net深度学习模型进行训练,获得图像超分辨率模型。然后,将预处理后的低分辨率1990GIMMS NDVI数据集输入至该模型,进行图像二阶段重构,获得重构后的250-m分辨率GIMMS NDVI数据集。对重构后的GIMMSMODIS NDVI数据集进行整理、配准和统一坐标投影,并进行数据精度验证,得到中国全域1990200020102020250-m NDVI数据集。最后,将全国地级行政区矢量数据、全国GUB矢量数据与NDVI数据集进行空间叠加,裁剪并提取城市行政边界和实体边界内所有的像素点并计算他们的NDVI均值,得到中国城市250-m分辨率植被覆盖数据集(19902020年)。

4  数据结果与验证

4.1  数据集组成

《中国十年度及361个城市平均NDVI值统计数据集(250-m19902020)》的组成内容、数据大小、数据类型和命名方式如表3所示,主要包括4个栅格数据和2个统计表格数据

4.2  数据结果

4.2.1  19902020年中国NDVI的时空变化

4展示了19902020250-m分辨率下中国全域NDVI分布。去除水体影响部分,1990200020102020年中国范围NDVI平均值分别为0.3160.2990.2870.297,呈现一个先下降后上升的变化趋势,即中国总体的国土绿度在19902010年呈现下降趋势,

3  技术路线流程图

 

3  中国十年度及361个城市平均NDVI值统计数据集(250-m19902020)包含数据列表

数据名称

对应文件

数据大小

数据格式

1990200020102020年中国250-m分辨率NDVI年平均数据

China_1990_2020_NDVI

6.51 GB

.tif

1990200020102020年中国城市行政范围和实体地域范围NDVI年平均数据

ChinaCities_1990_2020_NDVI

81 KB

.xlsx

 

但近10年改善明显。从空间格局来看,在19902020年间,中国植被指数空间分布格局相对稳定。受自然地理条件和气候因素影响,NDVI值总体呈现从东南沿海向西北内陆地区逐级递减。高值(NDVI>0.6)主要分布在中国东南丘陵、沿海地区和南部的云贵高原地区;中值(0.6>NDVI>0.3)主要分布在中国东部的华北平原、西部的四川盆地和东北部分地区;低值(NDVI<0.3)主要分布在西部的青藏高原、塔里木盆地,以及北部的内蒙古高原。对比图4a和图4d可以发现,从19902020年,植被绿度在南方大部分地区和黄土高原地区普遍增强,长三角城市群、京津冀城市群、珠三角城市群、山东半岛城市群的城镇密集区植被绿度减少明显,其他植被绿度减少明显的区域主要分布的西部地区。

4  1990-2020年中国NDVI时空格局图(依据审图号GS(2019)1823号标准地图制作

 

4.2.2  19902020年中国城市行政范围和实体地域范围内NDVI的时空变化

5展示了19902020年中国361个城市行政范围和实体地域范围NDVI的时空变化。城市行政范围内NDVI的时空分布及变化趋势与上文栅格尺度的特征基本一致,但城市实体地域范围的NDVI并不完全符合栅格尺度的规律,例如在长三角、珠三角、长江中游城市群的部分城市尽管行政区域内NDVI平均值比较高,但城市实体地域范围NDVI值比较低;新疆的和田市、昆玉市在行政区域内NDVI值比较低,但城市实体地域范围NDVI值却比较高。除了西北部分绿洲型城市之外,城市行政范围的NDVI值均大于城市实体地域范围的值。1990200020102020年全国城市实体地域范围NDVI平均值分别为0.3210.2780.2640.290,可见近十年全国的城市绿度有显著提升。

4.3  数据结果验证

由于NDVI数值缺乏地面站点监测直接证据,我们将不同NDVI产品数据统一到相同的空间分辨率和投影坐标系中,分析通过深度学习模型生成的本数据集与其他数据产品之间的相关性来验证本数据集的时空可靠性。本文以北京市为验证区域,大小约为16,392.99 km2,对应343,967个分辨率为250 m的像元。将本研究生成的2010250-m NDVI数据与Aqua-MODIS NDVILandsat 5 NDVINOAA NDVI三个数据产品进行逐像素的对比分析,分别计算相关系数、R2、均方根误差(RMSE)等。从图6结果来看,250-m NDVI数据结果与其他NDVI产品数据均有较强的相关性,相关系数分别为0.991,40.842,50.790,3。总体来看,本文生产的250-m NDVI数据集整体精度较高,数据结果具有一定的可靠性。

 

5  1990–2020年中国城市行政范围和实体地域范围NDVI时空变化
(依据审图号GS(2019)1823号标准地图制作)

 

6  模型拟合NDVI与其他NDVI产品数据交叉验证结果图(abc的交叉验证对象分别为:
Aqua-MODIS NDVI
Landsat 5 NDVINOAA NDVI

5  讨论和总结

本文基于30年的GIMMS NDVI数据和中高时空分辨率的Terre/MODIS NDVI数据,结合GUB城市边界数据集,运用Google Earth Engine平台和Python,采用图像超分辨率算法和交叉验证的方法,制作了19902020年中国城市250-m分辨率植被覆盖数据集。与已有的NDVI产品数据相比,本数据集将原先中高分辨率NDVI的观测时间从20年延长至30年,并通过叠加城市实体地域边界数据,计算了城市建成实体地域范围的NDVI。之所以本数据集中的NDVI选择了年度平均值,而没有采用NDVI年最大值,是考虑到年度平均值更能反映植被对人类福祉的全年贡献,更适应于在人与自然耦合研究、城市生态环境整体评价、城市化环境效应、城市生态治理等方向的应用。

本数据结果表明,1990–2020年中国全境和城市范围的NDVI均呈现先降低后升高的趋势,但区域间存在明显的异质性。虽然城市化进程使得城市周边大量植被覆盖区被转变为不透水地表,但城市建成范围内的NDVI在近十年呈现明显提升。这些结果表明城市绿地建设、退耕还林、植树造林、自然保护地建设等生态环境改善措施和修复工程已取得明显的成效,城市化正在给植被带来更多积极的影响。本数据集可以为后续进一步揭示更长时间序列下,中国植被覆盖对气候变化、人类活动和其他驱动因子的响应机理提供基础数据,也可以为指导政府部门评估区域生态环境质量、制定生态保护措施和区域可持续发展提供数据支撑。

 

作者分工:刘海猛对数据集的开发做了总体设计,撰写数据论文和数据可视化;周天宇采集和处理了数据,设计了模型和算法,撰写数据论文;勾鹏做了数据验证。

 

利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。

 

参考文献

[1]      Duveiller, G., Hooker, J., Cescatti, A. The mark of vegetation change on Earth’s surface energy balance [J]. Nature Communications, 2018, 9(1): 679.

[2]      Zhang, L., Yang, L., Zohner, C. M., et al. Direct and indirect impacts of urbanization on vegetation growth across the world’s cities [J]. Science Advances, 2022, 8(27): eabo0095.

[3]      王静, 周伟奇, 许开鹏等. 京津冀地区城市化对植被覆盖度及景观格局的影响 [J]. 生态学报, 2017, 37(21): 7019–7029.

[4]      Zhou, D., Zhao, S., Zhang, L., et al. The footprint of urban heat island effect in China [J]. Scientific Reports, 2015, 5(1): 11160.

[5]      Liu, H., Cui, W., Zhang, M. Exploring the causal relationship between urbanization and air pollution: evidence from China [J]. Sustainable Cities and Society, 2022, 80: 103783.

[6]      Liu, X., Wang, S., Wu, P., et al. Impacts of urban expansion on terrestrial carbon storage in China [J]. Environmental Science & Technology, 2019, 53(12): 6834–6844.

[7]      Cunsolo, W. A., Harper, S. L., Ford, J. D., et al. Climate change and mental health: an exploratory case study from Rigolet, Nunatsiavut, Canada [J]. Climatic Change, 2013, 121: 255–270.

[8]      Cheng, Y., Liu, H., Wang, S., et al. Global action on SDGs: policy review and outlook in a post-pandemic era [J]. Sustainability, 2021, 13(11): 6461.

[9]      Zhou, D., Zhao, S., Zhang, L., et al. Remotely sensed assessment of urbanization effects on vegetation phenology in China’s 32 major cities [J]. Remote Sensing of Environment, 2016, 176: 272–281.

[10]   Zhou, T., Liu, H., Gou, P., et al. Conflict or Coordination? Measuring the relationships between urbanization and vegetation cover in China [J]. Ecological Indicators, 2023, 147: 109993.

[11]   Fensholt, R., Proud, S. R. Evaluation of earth observation based global long term vegetation trends—comparing GIMMS and MODIS global NDVI time series [J]. Remote sensing of Environment, 2012, 119: 131–147.

[12]   徐洋, 杨雅萍. 1982–2020年中国5-km分辨率逐月NDVI数据集[DS]. 2022.

[13]   董金玮, 周岩, 尤南山. 2000-2020年中国30米年最大NDVI数据集[DS]. 2021.

[14]   刘海猛, 周天宇, 勾鹏. 中国十年度及361个城市平均NDVI值统计数据集(250-m1990–2020[J/DB/OL]. 全球变化数据仓储电子杂志, 2023. https://doi.org/10.3974/geodb.2023.04.06.V1. https://cstr.escience.org.cn/CSTR:20146.11.2023.04.06.V1.

[15]   全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. https://doi.org/10.3974/dp.
policy.2014.05 (2017
年更新).

[16]   Li, X., Gong, P., Zhou, Y., et al. Mapping global urban boundaries from the global artificial impervious area (GAIA) data [J]. Environmental Research Letters, 2020, 15(9): 094044.

[17]   Lei, S., Shi, Z., Zou, Z. Super-Resolution for remote sensing images via local–global combined network [J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(8): 1243–1247.